Control de grupo adaptativo para RL síncrono on-policy más rápido
Descubre cómo el control de grupo adaptativo reduce los retrasos por rezagados en RL síncrono, acelerando el entrenamiento y mejorando el rendimiento en benchmarks.
Descubre cómo el control de grupo adaptativo reduce los retrasos por rezagados en RL síncrono, acelerando el entrenamiento y mejorando el rendimiento en benchmarks.
¿Cómo acelerar el entrenamiento VLM sin perder sinergia? Descubre la asimetría en atención y los límites de la reducción de tokens. Estrategias clave.
Descubre TN-SHAP-G: calcula valores Shapley en gráficos usando redes de tensores, sin Monte Carlo. Explicabilidad eficiente para modelos complejos.
Descubre AsyMoE: nueva arquitectura para LVLMs que reduce alucinaciones y mejora eficiencia con expertos hiperbólicos y priorización de evidencia.
Descubre LALE, la nueva arquitectura Transformer ligera que bate récords de eficiencia en segmentación de imágenes satelitales. Solo 1.6M parámetros.
La destilación de políticas de deep RL en árboles de decisión mejora el control de redes eléctricas: mayor recompensa, supervivencia y transparencia.
Descubre cómo la observabilidad consciente de fallos permite detectar cómputo desperdiciado en sistemas multiagente LLM, ahorrando recursos y mejorando la eficiencia.
Descubre 1D-CGS, un modelo ligero que combina CNN 1D y GraphSAGE para rankear nodos influyentes en redes complejas con alta precisión y rapidez. Ideal para grandes escalas.
Descubre SAGE, el innovador gate que optimiza la memoria de LLMs agenticos: reduce costos de API 3.4x y latencia 2.5x manteniendo calidad.
Descubre cómo los complejos de cliques maximales escalan el aprendizaje de grafos de alto orden con mayor eficiencia y sin perder expresividad.
Descubre Hermes: agente que combina razonamiento informal y verificación formal en Lean para mejorar precisión matemática en LLMs un 40% con 80% menos coste.
Descubre DTop-p MoE, un nuevo mecanismo de enrutamiento dinámico que aprende el umbral de probabilidad para controlar la esparcidad, superando a Top-k y Top-p fijo en modelos fundacionales.
MedCoG optimiza el razonamiento médico de LLM con metacognición, logrando 6.2x más densidad de inferencia. Reduce costos y mejora precisión.
Descubre PRISM, un método que selecciona datos de instrucción visual sin entrenamiento, reduciendo costes y mejorando el rendimiento de modelos multimodales.
Descubre cómo SSMoE aprovecha los autovectores de los expertos para un enrutamiento sin colapso, mejorando modelos SMoE sin entrenamiento adicional.
Conoce SP-ESGC: método eficiente y escalable para condensar grafos preservando estructura. Mejora generalización y reduce costos computacionales.
Descubre cómo SiGMA generaliza el modelado multiescala de series temporales con un solo operador, logrando 5.3x más velocidad y 3.8x menos memoria.
Descubre DG-CoLearn: acelera hasta 33.8x el aprendizaje en grafos dinámicos con privacidad estructural y mejora del 13% en precisión.
DRIFT optimiza modelos de lenguaje en múltiples turnos con eficiencia de SFT y rendimiento de RL. Descubre cómo.
Descubre por qué la linearización de la última capa ofrece una cuantificación de incertidumbre comparable a la de toda la red, con mucha mayor eficiencia computacional. Estudio teórico y empírico.